复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持
复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持最近,OpenAI 的视频生成模型 Sora 爆火,生成式 AI 模型在多模态方面的能力再次引起广泛关注。
最近,OpenAI 的视频生成模型 Sora 爆火,生成式 AI 模型在多模态方面的能力再次引起广泛关注。
如果说 OpenAI 已经占据了今天闭源大模型生态的一极,那 Meta 无疑是代表开源大模型的另一极。
最近,OpenAI 视频生成模型 Sora 的爆火,给基于 Transformer 的扩散模型重新带来了一波热度,比如 Sora 研发负责人之一 William Peebles 与纽约大学助理教授谢赛宁去年提出的 DiT(Diffusion Transformer)。
根据 OpenAI 披露的技术报告,Sora 的核心技术点之一是将视觉数据转化为 patch 的统一表征形式,并通过 Transformer 和扩散模型结合,展现了卓越的扩展(scale)特性。
近日,有报道称,AI 技术的先驱——OpenAI 正在开发一款集成或可能独立的网络搜索产品,这一举措预示着 AI 在搜索技术中的角色将被进一步加强。
2 月 26 日消息,有网友在“X”上发布了 OpenAI Feather 的应用页面。
2023 年年底,很多人都预测,未来一年将是视频生成快速发展的一年。但出人意料的是,农历春节刚过,OpenAI 就扔出了一个重磅炸弹 —— 能生成 1 分钟流畅、逼真视频的 Sora。
2024/02/15,农历正月初六,OpenAI 发布了王炸级产品 Sora,可以通过文字描述生成长达 60s 的视频,画面非常流畅,真实度很高。一下子在国内互联网炸开了锅,得到了广泛传播。
在 OpenAI 发布 Sora 之后,很多人惊呼人类已经迈入 AI 视频时代。除了一次次震惊世界的 AI 视频生成能力展示之外,海外网友讨论的最多的话题,还有「未来该如何避免虚假视频充斥着我们的生活」?
2 月 16 日,OpenAI Sora 的发布无疑标志着视频生成领域的一次重大突破。Sora 基于 Diffusion Transformer 架构,和市面上大部分主流方法(由 2D Stable Diffusion 扩展)并不相同。